智能论文笔记

Multi-agent Bayesian Deep Reinforcement Learning for Microgrid Energy Management under Communication Failures

Hao Zhou , Atakan Aral , Ivona Brandic , Melike Erol-Kantarci

分类：机器学习

2021-11-22

Microgrids（MGS）是未来的缩小能量系统的重要参与者，其中许多智能的东西（物联网）设备在智能电网中的能量管理中相互作用。虽然MG能源管理有许多作品，但大多数研究都假设了一个完美的通信环境，其中不考虑通信故障。在本文中，我们将MG视为具有IOT设备的多智能传播环境，其中AI代理与其同行交换信息以进行协作。但是，由于通信故障或分组丢失，协作信息可能会丢失。这些事件可能会影响整个MG的操作。为此，我们提出了一种多种子体贝叶斯深增强学习（BA-DRL）方法，用于MG能量管理下的通信故障。我们首先定义多个代理部分观察到的马尔可夫决策过程（MA-POMDP）来描述在通信失败下的代理商，其中每个代理人可以更新其对同龄人的行动的信念。然后，我们在BA-DRL中应用用于Q值估计的双深度Q学习（DDQN）架构，并提出了基于信念的相关性平衡，用于多助剂BA-DRL的关节动作选择。最后，仿真结果表明，BA-DRL对供电不确定度和通信故障不确定性强大。 BA-DRL的奖励比NASH Deep Q-Learning（NASH-DQN）和乘法器（ADMM）的交替方向方法分别在1％的通信失效概率下进行4.1％和10.3％。

translated by 谷歌翻译

AI生成的合成数据允许提炼现有数据的一般模式，然后可以在原始语义中安全地将其作为颗粒级代表性但新颖的数据样本共享。在这项工作中，我们探讨了将域专业知识纳入数据综合的方法，以表示统计属性以及预先存在的规则知识。可以为任何数量的新样本探测的生成的合成数据生成器，然后可以作为智力的共同来源，作为学习通用语言，由人类和机器都消耗。我们为公开数据集演示了该概念，并通过描述性分析以及下游ML模型评估其好处。

translated by 谷歌翻译

深度学习模型在识别医学图像中的发现方面表现出了极大的有效性。但是，他们无法处理不断变化的临床环境，从而带来了来自不同来源的新注释的医学数据。为了利用传入的数据流，这些模型将在很大程度上受益于从新样本中依次学习，而不会忘记先前获得的知识。在本文中，我们通过应用现有的最新持续学习方法介绍了MedMnist收集中连续疾病分类的基准。特别是，我们考虑了三种连续的学习方案，即任务和班级增量学习以及新定义的跨域增量学习。疾病的任务和班级增量学习解决了对新样本进行分类的问题，而无需重新从头开始模型，而跨域增量学习解决了处理源自不同机构的数据集的问题，同时保留了先前获得的知识。我们对表现进行彻底的分析，并研究如何在这种情况下表现出灾难性遗忘的持续学习挑战。令人鼓舞的结果表明，持续学习具有推进疾病分类并为临床环境产生更强大，更有效的学习框架的主要潜力。将公开提供完整基准测试的代码存储库，数据分区和基线结果。

translated by 谷歌翻译